علم و فناوری هوش مصنوعی

همه چیز درباره‌ی Gemini ۳.۱ Pro | مدل زبانی جدید گوگل بر پایه استدلال

گوگل از نسخه جدید مدل زبانی خود با نام Gemini ۳.۱ Pro رونمایی کرده؛ مدلی که تمرکز اصلی آن بر تقویت توان استدلال و حل مسئله است. ادعای ثبت امتیاز ۷۷.۱ درصدی در بنچمارک ARC-AGI-۲ و نمایش دمو‌هایی با خروجی‌های مستقیم SVG، این نسخه را به یکی از جدی‌ترین به‌روزرسانی‌های اخیر در رقابت مدل‌های زبانی تبدیل کرده است.

خبرنگار شهاب راعی

به گزارش شهرآرانیوز، گوگل تلاش کرده با ارتقای لایه استدلال در مدل جدید خود، یک گام فراتر از تولید متن بر پایه داده های حفظ شده بردارد. Gemini ۳.۱ Pro بر پایه معماری‌های پیشرفته‌تر طراحی شده تا بتواند مسائل چندمرحله‌ای، الگو‌های ناشناخته و تحلیل‌های پیچیده را با دقت بالاتری پردازش کند.

همه چیز درباره‌ی Gemini ۳.۱ Pro | مدل زبانی جدید گوگل بر پایه استدلال

طبق اعلام رسمی گوگل، این مدل در نسخه دوم بنچمارک ARC-AGI موفق به کسب امتیاز ۷۷.۱ درصد شده است؛ رقمی که به گفته این شرکت تقریباً دو برابر عملکرد نسخه پیشین یعنی Gemini ۳ Pro است.

ARC-AGI یکی از آزمون‌هایی است که تمرکز آن بر سنجش توانایی مدل‌ها در کشف الگو‌های جدید و حل مسائل غیرتکراری است؛ یعنی به طوری که برای حل مسئله از داده های از پیش حفظ شده استفاده نکند، حوزه‌ای که بسیاری از مدل‌های زبانی در آن با افت عملکرد مواجه می‌شوند. اگر
این عدد در استفاده کاربران تکرار شود، می‌تواند نشان‌دهنده جهش واقعی در حوزه استدلال محاسباتی باشد.

تولید انیمیشن‌های SVG با یک پرامپت متنی ساده

بعضی از کاربران به ویژگی جدیدی اشاره کردند، نمایش و تولید مستقیم انیمیشن‌های SVG تنها با یک پرامپت متنی ساده انجام می‌شود. در این دمو، مدل بدون نیاز به ابزار واسط، کد‌های تمیز و آماده استفاده برای برنامه نویسان وب تولید می‌کند.

چنین قابلیتی در صورت پایداری و دقت بالا، می‌تواند ابزار‌های طراحی و پلاگین‌های تولید المان‌های گرافیکی را تغییر دهد. بسیاری از سرویس‌هایی که تاکنون نقش واسط میان ایده و خروجی فنی را ایفا می‌کردند، حالا با این قابلیت ممکن است با مدل‌هایی که مستقیماً خروجی قابل استفاده تولید می‌کنند وارد چالش شوند.

تقویت برنامه‌نویسی و پردازش داده‌های سنگین

گوگل تأکید کرده است که Gemini 3.1 Pro در سناریوهای کدنویسی چندمرحله‌ای، تحلیل داده‌های حجیم و حل مسائل منطقی پیچیده عملکرد بهتری ارائه می‌دهد. این بهبود می‌تواند برای توسعه‌دهندگان، تحلیل‌گران داده و تیم‌های تحقیقاتی که با پروژه‌های پیچیده سروکار دارند کمک بزرگی باشد.

در شرایط فعلی که رقابت میان غول‌های فناوری بالاگرفته است تمرکز بر کاهش خطای استدلالی اهمیت بیشتری از تولید متن ها با سرعت بالا دارد.

دسترسی رایگان یا اشتراکی؟

با وجود تمرکز تبلیغاتی بر توانمندی‌های جدید، دسترسی به Gemini ۳.۱ Pro برای همه کاربران آزاد نیست. نسخه Pro معمولاً از طریق پلن‌های اشتراکی و سرویس‌های توسعه‌دهنده گوگل ارائه می‌شود و کاربران عادی بدون حساب کاربری یا اشتراک پولی، به این سطح از مدل دسترسی کامل ندارند.

کاربران عمومی در سرویس‌هایی مانند Google Gemini معمولاً به نسخه‌های سبک‌تر دسترسی دارند، در حالی که قابلیت‌های پیشرفته‌تر از طریق اشتراک‌های حرفه‌ای یا API در اختیار توسعه‌دهندگان قرار می‌گیرد.

به بیان دیگر، تجربه کامل از توان استدلالی جدید این مدل، در حال حاضر محدود به کاربران اشتراک‌دار و سازمانی است.

بنابراین مدل زبانی جدید گوگل نشان می‌دهد رقابت مدل‌های زبانی از مرحله «چه کسی متن طبیعی‌تر تولید می‌کند» عبور کرده و وارد فاز «چه کسی بهتر فکر می‌کند» شده است. تمرکز بر استدلال، حل مسئله و تولید خروجی‌های فنی، بیانگر تغییر اولویت‌ها در بازار هوش مصنوعی است.

با این حال، قضاوت نهایی درباره میزان برتری این مدل نیازمند ارزیابی‌های مستقل و استفاده گسترده در پروژه‌های واقعی است. اگر ادعا‌های گوگل در عمل نیز تأیید شود، Gemini ۳.۱ Pro می‌تواند به یکی از ابزار‌های کلیدی نسل جدید توسعه نرم‌افزار و پردازش داده تبدیل شود؛ در غیر این صورت، این اعداد نیز مانند بسیاری از بنچمارک‌های تبلیغاتی، صرفاً بخشی از جنگ روایت‌ها در رقابت غول‌های فناوری خواهد بود.